<?php

// 建立Google查詢用的uri
$search_uri = 'http://www.google.com.tw/search?q=Powered+by+ProxyPy+v1.4+site:appspot.com&hl=zh-TW&prmd=imvns&ei=n5DcTreuE_DImAXuj_3YCw&start=30&sa=N&biw=1280&bih=899&start=%d';
$output = array(); // 放結果

// 預計只抓20頁的搜尋結果來看
for ($i = 0; $i < 40; $i++) {
  $ch = curl_init(sprintf($search_uri, $i*10 ));
  curl_setopt_array($ch, array(
    CURLOPT_RETURNTRANSFER  =>  1,
  ));
  $result = curl_exec($ch);
  $info = curl_getinfo($ch);
  curl_close($ch);

  // 代表Google可能ban掉這台機器的查詢了
  if ($info['http_code'] > 299 || $info['http_code'] < 200) {
    sleep(5);
    continue;
  }
  ++$i;
  preg_match_all('#\<cite\>([^/]*)#', str_replace(array('www.', 'https://'), '', $result), $match);
  if (!empty($match)) {
    $output = array_merge($output, $match[1]);
  }
  sleep(5);
}
// 排除掉重複的
$output = array_unique($output);

$xml = new simpleXMLElement('<proxies created_on="'.date('Y-m-d H:i:s').'"></proxies>');
if (!empty($output)) {
  foreach ($output as $o) {
    if (!preg_match('#\.appspot\.com#', $o)) {
      continue;
    }
    $xml->addChild('proxy', $o);
  }
}
$xml_content = $xml->asXML();


// 寫入檔案
$fp = fopen('proxypy.xml', 'w');
fwrite($fp, $xml_content);
fclose($fp);

?>
